Descripción del conjunto de datos

Los datos han sido tomados del Departamento de Salud y Servicios Humanos de EE.UU, en su Centro de control y prevención de enfermedades. La base de datos seleccionada ha sido Indicadores de ansiedad o depresión basados en la frecuencia informada de los síntomas durante los últimos 7 días y se accede mediante este enlace.

La relevancia de los datos reside en el tema que trata al manifestar la importancia del bienestar de la salud mental ante los problemas de ansiedad y depresión que el Covid-19 ha traído a los hogares e impactado a las familias en Estados Unidos. Son datos recolectados y actualizados cada 7 días desde el inicio de la pandemia Covid-19 en el 2020. Se destaca que se ha empleado para el estudio a diferentes grupos de la población, como Estado, edad, raza o etnia, educación, sexo y género con el que se identifican.

En este trabajo se busca analizar de manera visual la información del dataset aplicando diferentes técnicas de visualización y de responder a las preguntas:

  • Qué período de tiempo presenta un mayor aumento de la variable CI según los grupos y subgrupos?
  • Qué grupo o subgrupo presenta niveles más altos o bajos de IC?
  • La proyección del valor IC aumenta o disminuye en el siguiente año?

Análisis y exploración de los datos

La exploración de los datos busca explicar las principales características de los mismos. Ejemplo de los datos que conforman la base de datos. Las variables que la componen son de diferentes tipos: categóricas, numéricas y fecha.

## 'data.frame':    11718 obs. of  14 variables:
##  $ Indicator             : Factor w/ 3 levels "Symptoms of Anxiety Disorder",..: 3 3 3 3 3 3 3 3 3 3 ...
##  $ Group                 : Factor w/ 9 levels "By Age","By Disability status",..: 9 1 1 1 1 1 1 1 6 6 ...
##  $ State                 : Factor w/ 52 levels "Alabama","Alaska",..: 45 45 45 45 45 45 45 45 45 45 ...
##  $ Subgroup              : Factor w/ 78 levels "18 - 29 years",..: 69 1 2 3 4 5 6 7 37 21 ...
##  $ Phase                 : Factor w/ 11 levels "-1","1","2","3 (Jan 6 – Mar 29)",..: 2 2 2 2 2 2 2 2 2 2 ...
##  $ Time.Period           : num  1 1 1 1 1 1 1 1 1 1 ...
##  $ Time.Period.Label     : Factor w/ 59 levels "Apr 14 - Apr 26, 2021",..: 2 2 2 2 2 2 2 2 2 2 ...
##  $ Time.Period.Start.Date: Date, format: "2020-04-23" "2020-04-23" ...
##  $ Time.Period.End.Date  : Date, format: "2020-05-05" "2020-05-05" ...
##  $ Value                 : num  23.5 32.7 25.7 24.8 23.2 18.4 13.6 14.4 20.8 26.1 ...
##  $ Low.CI                : num  22.7 30.2 24.1 23.3 21.5 17 11.8 9 19.6 25.2 ...
##  $ High.CI               : num  24.3 35.2 27.3 26.2 25 19.7 15.5 21.4 22 27.1 ...
##  $ Confidence.Interval   : chr  "22.7 - 24.3" "30.2 - 35.2" "24.1 - 27.3" "23.3 - 26.2" ...
##  $ Quartile.Range        : chr  "" "" "" "" ...

Análisis variables categóricas

Se va a analizar la distribución de las variables categóricas en función de otras subcategorías como edad, género o nivel de estudio.

Variable IC

Distribución del valor IC vs Indicador

Distribución del valor IC vs Grupos

Distribución del valor IC en Grupo:Edad vs Subgrupos

Distribución del valor IC en Grupo:Educación vs Subgrupos

Frecuencia de cada grupo por edad respecto a la fase del proyecto

Se observa que en cada fase se ha registrado la misma cantidad de personas para cada grupo de edad.

Distribución del valor IC en Grupo:Status de discapacidad vs Subgrupos

Distribución del valor IC en Grupo:Identidad de género vs Subgrupos

Distribución del valor IC en Grupo:By Race/Hispanic ethnicity vs Subgrupos

Distribución del valor IC en Grupo:Sexo vs Subgrupos

Distribución del valor IC en Grupo:Orientación sexual vs Subgrupos

Distribución del valor IC en Grupo:Estado vs Subgrupos

Distribución del valor IC en cada Fase

Distribución del valor IC en cada periodo de tiempo

Evolución de la variable IC

Se busca analizar y visualizar la evolución de los niveles de CI por el periodo de tiempo que los datos han sido tomados. Dado que se trabaja con valores en función del tiempo, una serie de tiempo permite proyectar resultados y estimar valores para un año después.

Serie del valor IC (valor medio)

Variable IC (valor medio) por Indicador

Variable IC (valor medio) por Edad

Variable IC (valor medio) por Status de discapacidad

Variable IC (valor medio) por Educación

Variable IC (valor medio) por Identidad de Género

Variable IC (valor medio) por Raza/Etnia Hispana

Variable IC (valor medio) por Sexo

Variable IC (valor medio) por Orientación Sexual

Variable IC (valor medio) por Estado

MODELO DE PREDICCION ARIMA

## Series: ts_serie[, 8] 
## ARIMA(0,0,0)(0,1,0)[12] 
## 
## sigma^2 = 20.13:  log likelihood = -64.24
## AIC=130.48   AICc=130.68   BIC=131.58
## 
## Training set error measures:
##                 ME     RMSE      MAE      MPE     MAPE     MASE      ACF1
## Training set 0.311 3.609288 2.499235 1.092679 10.57363 0.649152 0.2794565

Pronóstico con Arima del valor IC por Indicador

Resultados

Finalmente, la base de datos y la información que aporta va dirigida al público en general para que conozcan la importancia de la salud mental como efecto colateral de la pandemia Covid-19. Después de tanta explotación de las bases que muestran los casos de fallecidos y tratados por covid, es bueno que se conozca el impacto de la pandemia en la situación laboral, el gasto de los consumidores, la seguridad alimentaria, la vivienda, las interrupciones en la educación y en especial en el bienestar físico y mental.

Desde lo personal, se busca responder a la interrogante de que periodo de tiempo fue el más difícil, en cuanto a salud mental, para las personas durante la pandemia. Se destaca nuevamente la importancia del bienestar mental en una época con importantes avances tecnológicos.